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摘要 : 【 目的 】 分 析 新 农 合 药品 报销 目录 存在 的 问题 ， 提 出 整合 技术 路 线 ,， 开 发 信息 系统 , 整合 多 来 源 词 表 , 生 
成 国家 新 农 合 药品 一 体 化 目录 。[ 方法 ] 借鉴 UMLS 整合 技术 路 线 , 采用 映射 的 方法 对 多 来 源 药 品 字典 集成 存在 
的 问题 进行 解决 。[ 结果 】 制定 了 相应 的 新 农 合 药品 编码 目录 数据 结构 和 映射 算法 ,完成 了 国家 新 农 合 一 体 化 目 
录 构 建 系统 的 设计 与 开发 。[ 局 限 】 药品 之 间 相 互 药理 作用 关系 还 需 进 一 步 梳理 完善 。[【 结论 】 经 过 制定 数据 结 
构 和 映射 算法 对 新 农 合 目录 编码 进行 映射 , 解决 了 构建 国家 新 农 合 药品 目录 编码 中 多 来 源 字典 集成 问题 。 
关键 词 : 新 型 农村 合作 医疗 ”多 来 源 字典 ”药品 编码 ”集成 映 身 

分 类 号 : R19 G350 


1 引 对 每 一 个 数据 源 分 别 建立 模型 , 然后 利用 Meta- 
Learner 分 别 对 模型 进行 评价 , 最 终 实现 异 构 数据 源 的 
随 着 新 农 合 政策 的 执行 , 实现 数据 交换 和 数据 集成 是, 在 国内 方面 , 才 苗 提出 基于 神经 网 络 的 异 构 数 
共享 已 成 为 大 势 所 趋 ， 数据 的 共享 有 助 于 推动 新 农 据 库 语义 集成 技术 多 ; 文 语 欣 则 采用 语义 技术 解决 临 
合 政 策 的 贯彻 落实 , 实现 新 农 合 患者 就 医 便 利 、 报 销 床 信息 异 构 问 题 , 提出 基于 物理 层 、 语 义 层 和 应 用 层 
便捷 趾 。 其 中 新 农 合 药品 报销 目录 是 进行 就 医 结算 报 的 三 层 架 构 模 型 的 临床 信息 交换 框架 , 解决 医疗 信息 
销 的 依据 , 但 是 目前 各 省 新 农 合 信息 系统 药品 目录 不 系统 之 间 的 信息 共享 1 郭 奢 提出 基于 本 体 的 异 构 数 
一 致 ， 难 以 进行 相关 数据 分 析 以 及 路 省 就 医 即 时 结 据 集 成 技术 ,以 解决 异 构 数 据 源 之 间 存 在 的 系统 异 
算 。 因 此 有 必要 建立 统一 性 、 延 展 性 与 适应 性 均 较 好 构 、 语 法 异 构 和 语义 异 构 问 题 中 。 
的 国家 一 体 化 药品 目录 。 UMLS(Unified Medical Language System)" 是 
在 对 多 个 异 构 数据 源 进行 集成 时 , 若 数据 集成 系 使 用 最 为 广泛 的 计算 机 化 的 情报 检索 语言 集成 系统 ， 
统 中 的 本 体 是 单独 建立 而 不 是 参照 同一 个 共享 本 体 构 作为 语言 规范 化 、 翻 译 的 工具 ,可 实现 跨 数据 库 交 互 
建 , 会 造成 局 部 本 体 间 存在 语义 不 一 致 的 情况 , 为 了 的 词汇 转换 。UMLS 通过 对 术语 的 标 化 等 处 理 n", 实 
系统 内 查询 处 理 的 正常 运行 ,必须 建立 本 体 映 射 握 。 目 现 了 对 100 余 词 典 100 万 以 上 的 概念 的 集成 0 应 用 
前 国内 外 就 异 构 数据 源 集成 技术 已 展开 较 多 的 研究 。 于 健康 信息 互 操作 、 医 学 术语 、 药 品名 称 的 联接 、 
外 方面 ，Husain 等 开发 SOCR (Statistics Online ”保险 账单 的 编码 等 。 本 文 主要 针对 新 农 合 药 品 报销 
Computational Resource) 系 统 来 处 理 不 同 来 源 的 数据 目录 编码 进行 集成 ,由 于 各 省 的 目录 编码 都 是 在 
集成 问题 5 Verbeke 等 提出 基于 语义 网 络 的 数据 集成 方 ”《 国 家 基本 医疗 保险 、 工 伤 保险 和 生育 保险 药品 目录 
法 实现 对 不 同 来 源 的 肿瘤 数据 的 集成 Scheurwegs 等 (2009 版 ) 六 《国家 基本 药物 目录 (2012 版 )》 目 录 的 


了 中 
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基础 上 根据 本 地 情况 进行 适当 改造 (了 。 因 此 本 文 借 
鉴 UMLS 的 技术 整合 路 线 ， 参考 UMLS 词 表 结构 进 
行 数据 结构 设计 ， 完成 了 《国家 基本 药物 目录 》《 社 
会 基本 医疗 保险 、 工 伤 保险 和 生育 保险 药品 目录 》 

以 及 安徽 、 河 南 等 10 个 省 的 新 农 合 药品 报销 目录 的 


救 合 


JEHDo 


2 ”研究 对 象 与 方法 


2.1 数据 来 源 
来 源 词 表 包括 : 《国家 基本 药物 目录 (2012 版 )》 
(简称 “国家 基 药 日 录 ”)( 药 品 数 ，520)、《 国 家 基本 医疗 
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保险 、 工 伤 保险 和 生育 保险 药品 目录 (2009 版 )》( 简 称 
“社保 目录 ”)( 药 品 数 ，3277), 以 及 安徽 (药品 数 ， 
1 885)、 福 建 ( 药 品 数 , 2 341)、 河 南 (药品 数 ,2 714)、 江 
苏 (药品 数 , 1 198)、 四 川 (药品 数 , 1 330)、 河 北 (药品 数 ， 
1 686) 、 吉 林 ( 药 品 数 , 1 806)、 黑 龙 江 ( 药 品 数 , 2 172)、 
湖南 (药品 数 , 1 781)、 内 蒙古 (药品 数 , 2 082) 等 10 省 新 
农 合 药 品 报销 目录 。 
2.2 ”研究 方法 

(1) 数据 结构 设计 

本 文 借鉴 UMLS 词 表 整 合 系统 设计 了 国家 新 农 合 
一 体 化 目录 构建 系统 数据 结构 ， 如 图 1 所 示 : 


登记 来 源 词 表 | . ee 
来 沁 放 节点 元 数据 表 (NodeMet A 
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图 1 中 来 源 词 表 (SAB) 用 于 登记 来 源 词 表 , 将 国家 
基 药 目录 、 社 保 目 录 以 及 安徽 等 10 个 省 目录 按 顺 序 存 
放 到 来 源 词 表 中 ; 节点 元 数据 表 (NodeMeta) 用 于 存放 
来 源 字 表 各 字段 信息 , 将 国家 基 药 目录 、 社 保 目录 以 
及 各 省 级 药品 目录 中 的 字段 信息 存放 到 节点 元 数据 表 
中 ; 节点 元 数据 关系 表 (Col_Rel) 用 于 存储 节点 元 数据 
表 中 各 个 字段 之 间 的 关系 ; 主题 词 盛 放 表 (Subject) 用 


于 存放 一 体 化 词 表 中 的 主题 词 相关 信息 ; 主题 词 项 目 
信息 表 (NodeItem) 用 于 存放 主题 词 各 项 目 详细 信息 ; 
主题 词 关系 表 (Sub_Rel) 用 于 存放 一 体 化 词 表 中 主题 
词 之 间 的 关系 ; 节点 类 型 表 (NodeType) 用 于 存储 主题 
词 字 段 的 类 型 ， 解决 词 系 词 篮 问 题 。 

(2) 映射 算法 设计 

构建 映射 算法 规则 ,实现 各 省 级 目录 向 国家 级 目 
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录 和 集成 映射 , 算法 映射 规则 如 下 : 

提示 与 该 节点 的 父 节点 相同 或 相似 的 子 节点 ; 

@) 提 示 与 该 节点 某 些 字段 相同 的 词 条 ， 如 名 称 相同 的 ， 
编码 相同 的 ， 对 于 编码 相同 的 ， 又 可 提示 该 编码 的 兄弟 节点 ; 

图 提示 与 该 节点 相似 度 最 大 的 前 20 个 词 条 ; 

相似 度 计算 S=( 字 段 i 的 相同 部 分 ^2/ 字 段 i 的 总 长 度 ) (Al 
与 A2 相同 部 分 ^2/A1 字段 与 A2 字段 的 长 度 之 和 ); 

@ 在 目录 映射 中 ， 出 现 语 义 相 同 ， 名称 不 同 的 , 主要 原 
因 是 语序 不 一 致 ， 因 此 ,忽略 语序 顺序 进行 词 条 比 对 相似 度 
计算 ; 

图 提供 包含 关系 的 词 条 发 现 , 如 词 条 A， 可 检索 完全 包 
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2 分 别 为 目录 示例 。 
表 1 2012 版 国家 基 药 目录 示例 
序号 编码 品名 分 类 标注 剂型 


[al 
1 GJJY-HS-1 ”青霉素 青霉素 类 注射 用 无 菌 粉末 


表 2 2015 年 河北 省 药品 目录 示例 
序号 ”编码 品名 拼音 码 分 类 标注 剂型 
1 10101006 青霉素 qmsjyzsywjfm ”青霉素 类 ”注射 用 无 菌 粉 末 


(1) 按 顺序 分 别 将 国家 基 药 目录 、2015 年 河北 省 


含 词 条 A 的 词 条 。 
(3) 映射 流程 
国家 新 农 合 一 体 化 目录 构建 系统 旨 在 基于 各 省 新 

农 合 目录 的 基础 上 , 构建 一 套 全 面 、 细 粒度 的 国家 级 

目录 ， 从 而 建立 各 省 与 国家 新 农 合 一 体 化 目录 的 映 

射 。 字 典 目录 集成 系统 的 构建 流程 如 图 2 所 示 : 


录入 数据 表 信 息 


导入 或 者 录入 素材 
( 即 目 录 数 据 ) 


建立 映射 关系 


图 2 国家 新 农 合 一 体 化 目录 构建 流程 


首先 将 国家 基 药 目录 作为 国家 一 体 化 目录 的 初始 
值 , 然后 按 顺 序 分 别 将 社保 目录 , 安徽 ,河南 等 各 省 级 
新 农 合 目 录 转 化 为 指定 格式 , 根据 制定 的 映射 算法 ， 
完成 药品 名 称 的 集成 映射 。 


3 ”研究 过 程 


3.1 整合 实例 
以 2012 版 国家 基 药 目录 和 2015 年 河北 省 药品 目 
录 中 的 “青霉素 ”为 例 阐述 系统 的 映射 过 程 。 表 1 和 表 
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药品 目录 登记 到 来 源 词 表 (SAB) 中 , 存储 形式 如 表 3 
所 示 : 
表 3 来 源 词 表 (SAB) 存 储 示例 


SAB_ID SAB Name SAB ABR SAB DESC BI 
2012 版 国家 。 国家 基 药 ee 国家 基 药 D0 
基 药 目录 ID 目录 EY 目录 
2015 年 河北 省 2015 河北 省 ;bi | 。 河北 省 ee 
药品 目录 ID ”药品 目录 Ma 药品 目录 


(2) 将 来 源 词 表 中 的 各 字段 信息 存放 到 节点 元 数 
据 表 (NodeMeta) 中 , 存储 形式 如 表 4 所 示 , 并 将 来 源 
词 表 字段 之 间 的 关系 存放 到 节点 元 数据 关系 表 
(Col_ ReD 中 , 在 示例 中 并 未 涉及 相关 字段 , 但 在 江苏 
省 2009 年 药物 目录 中 存在 县 (市 、 区 ) 和 乡 (镇 ) 两 个 字 
段 , 该 两 个 字段 之 间 的 隶属 关系 应 存放 到 节点 元 数据 
关系 表 中 。 

(3) 将 国家 基 药 目录 存放 到 主题 词 威 放 表 中 作 
为 初始 值 ， 形 成 初始 化 的 国家 新 农 合 一 体 化 目录 ， 
然后 将 社保 目录 , 安徽、 河南 等 新 农 合 目 录 向 一 体 
化 目录 映射 。 在 省 级 目录 与 国家 新 农 合 一 体 化 目录 
进行 映射 时 ,将 该 省 级 目录 与 国家 新 农 合 一 体 化 目 
录 药 品名 称 进行 逐条 比 对 ， 比 对 的 对 象 是 药品 名 称 
和 剂型 。 如 果 国 家 新 农 合 一 体 化 药品 目录 中 已 包含 
该 药品 ， 则 建立 映射 关系 。 如 果 国 家 新 农 合 一 体 化 
目录 中 未 包含 该 药品 ， 则 增加 该 药品 到 国家 新 农 合 
一 体 化 目录 中 。“ 是 否 包 含 ” 的 判断 依据 为 ,品名 一 致 
或 品名 不 一 致 但 有 效 成 分 一 致 ， 并 且 剂 型 一 致 ， 则 
判断 为 “包含 ”"。 同 一 种 药品 ,不 同 剂型 视 作 不 同 记 
录 , 暂 不 考虑 规格 的 差异 ,主题 词 戌 放 表 示例 如 表 5 
所 示 。 由 于 2015 年 河北 省 药品 目录 “青霉素 ”药品 向 一 
体 化 目录 映射 时 , 该 药品 已 经 存在 ， 且 品名 和 剂型 均 
一 致 ， 故 不 存放 到 主题 词 盛 放 表 中 ,而 2015 年 河北 省 
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药品 目录 中 的 “头孢 替 哗 ?在 一 体 化 目录 中 不 存在 ， 故 
将 其 并 增 到 一 体 化 目录 中 。 
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(4) 将 主题 词 盛 放 表 中 主题 词 的 项 目 信息 存放 到 
主题 词 项 目 信 息 表 (NodeItem)， 如 表 6 所 示 。 


表 4 节点 元 数据 表 (NodeMeta) 存 储 示 例 


Col ID Col Key LABEL SAB _ID Col DESC B1 
序号 ID xh 序号 2012 版 国家 基 药 目录 ID 基 药 目录 字段 2012 
编码 ID bm 编码 2012 版 国家 基 药 目录 ID 基 药 目录 字段 2012 
品名 ID pm 品名 2012 版 国家 基 药 目录 ID 基 药 目录 字段 2012 
分 类 ID fl 分 类 2012 版 国家 基 药 目录 ID 基 药 目录 字段 2012 
剂型 ID jx 标注 剂型 2012 版 国家 基 药 目录 ID 基 药 目录 字段 2012 
序号 ID xh 序号 2015 年 河北 省 药品 目录 ID 河北 省 药品 目录 字段 2015 
编码 ID bm 编码 2015 年 河北 省 药品 目录 ID 河北 省 药品 目录 字段 2015 
品名 ID pm 品名 2015 年 河北 省 药品 目录 ID 河北 省 药品 目录 字段 2015 
拼音 码 ID pim 拼音 码 2015 年 河北 省 药品 目录 ID 河北 省 药品 目录 字段 2015 
分 类 ID fl 分 类 2015 年 河北 省 药品 目录 ID 河北 省 药品 目录 字段 2015 
标注 剂型 ID jx 标注 剂型 2015 年 河北 省 药品 目录 ID 河北 省 药品 目录 字段 2015 

表 5 主题 词 盛 放 表 (Subject) 存 储 示例 
Sub_ID Sub_STR Sub_ID Sub_DESC Bl 
青霉素 ID 青霉素 2012 版 国家 基 药 目录 ID 青霉素 药品 2012 版 基 药 目录 
头孢 替 唑 ID 头孢 替 唑 2015 年 河北 省 药品 目录 ID 头孢 替 哗 2015 年 河北 药品 目录 
表 6 主题 词 项 目 信息 表 (NodeItem) 存 储 示 例 
Item ID Sub_ID Item Col ID Item Col Value Node Rank Bl 

项 目 ID1 2012 版 国家 基 药 目录 ID xh 1 1 序号 

项 目 ID2 2012 版 国家 基 药 目录 ID bm GJJY-HS-1 2 编码 

项 目 ID3 2012 版 国家 基 药 目录 ID pm 青霉素 3 品名 

项 目 ID4 2012 版 国家 基 药 目录 ID fl 青霉素 类 4 分 类 

项 目 ID5 2012 版 国家 基 药 目录 ID jx 标注 剂型 5 剂型 

项 目 ID6 2015 年 河北 省 药品 目录 ID xh 1 1 序号 

项 目 ID7 2015 年 河北 省 药品 目录 ID bm 10102013 2 编码 

项 目 ID8 2015 年 河北 省 药品 目录 ID pm 头孢 兰 唑 3 品 

项 目 ID9 2015 年 河北 省 药品 目录 ID pim tbtzzsj 4 拼音 人 码 

项 目 ID10 2015 年 河北 省 药品 目录 ID fl 头孢 菌 素 5 分 类 

项 目 ID11 2015 年 河北 省 药品 目录 ID jx 注射 剂 6 剂型 

将 主题 词 之 间 的 关系 ( 即 相关 药物 之 间 的 协同 ( 增 表 8 节点 类 型 表 (NodeType) 存 储 示例 

效 )、 相 加 (增加 )、 持 抗 ( 减 效 ) 等 ) 存 放 到 主题 词 关系 表 NodeType ID Item ID Type STR SAB_ID Bl 
中 , 并 将 主题 词 所 属 的 类 型 存放 到 节点 类 型 表 中 , 分 ee 2012 版 国家 ”2012 版 


别 如 表 7 和 表 8 所 示 : 


表 7 


主题 词 关系 表 (Sub_Rel) 存 储 示例 


Sub Rel ID From Sub ID To Sub ID Sub Rel Type BI 


关系 ID 


胺 矶 酮 ID 


美 托 洛 尔 ID ”协同 作用 增 效 


基 药 目录 ID 基 药 目录 


3.2 ”整合 结果 
通过 对 国家 基 药 目录 、 国 家 社保 药品 目录 、 安 徽 等 


10 省 新 农 合 药品 目录 进行 整合 。 不 考虑 剂型 的 情况 下 ， 
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共计 4 136 种 , 其 中 西药 2 112 种 , 中 药 2 024 种 ; 考虑 齐 


型 , 共计 6 061 种 , 其 中 西药 2 946 种 , 中 药 3 115 种 。 


二 


4 系统 核心 功能 实现 


通过 设计 基于 UMLS 的 数据 结构 , 制定 相关 的 映 
射 算法 ,并 以 整合 药品 目录 为 基础 ， 开 发 了 国家 新 农 
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_ 记 上 文 


右 侧 显示 的 是 国家 新 农 合 一 体 化 目录 , 然后 点 击 建立 
对 照 ， 即 可 完成 省 级 目录 向 国家 新 农 合 一 体 化 目录 的 
映射 。 


S 结 语 


本 文 分 析 了 构建 新 农 合 国家 一 体 化 目录 中 存在 的 


合 一 体 化 目录 构建 系统 , 完成 国家 新 农 合 目录 (疾病 编 
码 、 药 品 编码 、 诊 疗 编码 规范 、 耗 材 编码 规范 和 机 构 
编码 ) 的 初始 化 及 与 各 省 新 农 合 字典 目录 的 对 照 ， 建 立 
了 关联 , 并 实现 了 国家 新 农 合 一 体 化 目录 的 及 时 更 
新 。 系 统 主要 通过 国家 新 农 合 一 体 化 目录 初始 化 和 映 
射 管理 实现 集成 目录 的 构建 。 在 目录 初始 化 界面 , 选 
择 一 个 目录 大 类 , 然后 选择 一 个 省 份 以 及 省 目录 版 本 ， 
此 时 会 在 省 目录 框 中 出 现 所 选择 的 目录 树 ， 再 选择 国 
家 新 农 合 一 体 化 目录 版 本 ,国家 新 农 合 一 体 化 目录 框 
中 会 出 现 国 家 新 农 合 一 体 化 目录 树 , 将 左 侧 省 目录 树 
中 的 树 节点 拖 动 到 右 侧 国 家 新 农 合 一 体 化 目录 树 下 面 
的 某 个 节点 ， 即 完成 了 国家 新 农 合 一 体 化 目录 的 初始 
化 功能 ， 如 图 3 所 示 : 


图 4 映射 管理 功能 


如 图 4 所 示 , 在 映射 管理 功能 模块 中 , 选择 一 个 
目录 大 类 , 并 选择 一 个 省 份 以 及 省 目录 版 本 ， 和 一 个 
国家 新 农 合 一 体 化 目录 版 本 , 在 左 侧 显示 的 是 省 目录 ， 


现代 图 书 情报 技术 


问题 ， 针 对 这 些 问题 ， 提 出 了 集成 映射 的 解决 方法 ， 
制定 了 相应 的 数据 结构 、 集 成 映射 规则 与 算法 , 并 开 
发 了 国家 新 农 合 平台 一 体 化 目录 构建 系统 , 实现 了 各 
个 省 目录 向 国家 新 农 合 一 体 化 目录 的 集成 和 映射 。 随 
着 目录 的 成 熟 ， 以 及 配套 政策 的 出 台 , 可 将 集成 目录 
用 于 新 农 合 跨 省 就 医 的 异地 结算 和 即时 结 报 中 。 

本 研究 还 存在 一 定 的 局 限 , 药品 之 间 相 互 药理 作 
用 关系 库 还 需 进一步 完善 以 及 多 种 药品 之 间 的 药理 作 
用 关系 还 需 进一步 研究 ,系统 功能 完善 后 , 将 国家 一 
体 化 目录 作用 于 全 国 新 农 合 跨 省 就 医 即时 结 报 中 ， 以 
引导 各 地 结算 政策 的 衔接 。 
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Building a National System for the Reimbursable Prescription Drugs 


LiYazi Zheng Jianli Zhou Yiyang LiGuolei 
(Institute of Medical Information, Chinese Academy of Medical Sciences, Beijing 100020, China) 


Abstract: [Objective] This paper examines the current reimbursable prescription drugs list and creates a national 
prescription drugs catalog for the new rural cooperative medical system (NCMS). [Methods] We modified the 
technology framework of the Unified Medical Language System and used the mapping algorithms to aggregate the 
multi-source list of reimbursable prescription drugs. [Results] We designed the data structure and directory-mapping 
algorithm, for the integrated NCMS drugs catalog. [Limitations] More research was needed to analyze interactions 
among these drugs. [Conclusions] The proposed method helps us develop a list of reimbursable drugs from multiple 
sources. This new system solves the existing problems of data dictionary aggregation. 


Keywords: New rural cooperative medical system Multiple sources dictionary Drug coding Integrated mapping 
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